home *** CD-ROM | disk | FTP | other *** search
/ Night Owl 6 / Night Owl's Shareware - PDSI-006 - Night Owl Corp (1990).iso / 029a / pcindx.zip / HELP.004 < prev    next >
Text File  |  1991-08-20  |  28KB  |  566 lines

  1.  
  2.                              FILE menu:
  3.  
  4.   The FILE is divided into three sections:  Single Word Functions,
  5.   Phrase Functions, and Miscellaneous.  
  6.  
  7.   The FILE menu has 12 available selections:  Extract Single Words,
  8.   Extract Capitalized Words, Build Single Word Index, Word
  9.   Frequency, Spinoff Unique Words, Extract Phrases, Extract
  10.   Personal Names, Build Phrase Index,  View Index on Screen, Print
  11.   Index to Printer, Save Defaults, and Go to DOS.
  12.  
  13.   ┌───────────────────────────────────────────────────────────────┐
  14.   │  ┌──────────────────────────┐                                 │
  15.   │  │ ──Single Word Functions──│                                 │
  16.   │  │ Extract Single Words     │                                 │
  17.   │  │ Extract Capitalized Words│                                 │
  18.   │  │ Build Single Word Index  │                                 │
  19.   │  │ Word Frequency           │                                 │
  20.   │  │ Spinoff Unique Words     │                                 │
  21.   │  │ ──Phrase Word Functions──│                                 │
  22.   │  │ Extract Phrases          │                                 │
  23.   │  │ Extract Personal Names   │                                 │
  24.   │  │ Build Phrase Index       │                                 │
  25.   │  │ ─────Miscellaneous───────│                                 │
  26.   │  │ View Index on Screen     │                                 │
  27.   │  │ Print Index to Printer   │                                 │
  28.   │  │ Save Defaults            │                                 │
  29.   │  │ Go to DOS                │                                 │
  30.   │  └──────────────────────────┘                                 │
  31.   │                                                               │
  32.   │ PC─INDEX 4.0─Index Generator Copyright  1989─91 Help Software │
  33.   └───────────────────────────────────────────────────────────────┘
  34.  
  35.   This menu is broken down into three categories.  The first
  36.   category is Single Word Functions, the second section contains
  37.   Phrase Functions,  and the last is Miscellaneous Functions.
  38.  
  39.                         Extract Single Words
  40.  
  41.   Extract Single Words is the first item in the menu.  It is also
  42.   the first step performed in creating a single word index.  It's
  43.   function is to extract each individual word from a document and
  44.   record it.  
  45.  
  46.   This option will extract all words in a document, one at a time,
  47.   and record them in sorted order along with the page number that
  48.   they occur on.  
  49.  
  50.   Before you begin with the Extract Words selection, you need to
  51.   select the proper document type from the DOCUMENT menu.  
  52.  
  53.   Select the Extract Single Words option from the FILE menu.  You
  54.   should now see a new window asking you for an input filename, an
  55.   output filename, the page size, the first page number to start
  56.   indexing on, and the first page number to use and several other
  57.   options.
  58.  
  59.   For the input filename, enter the name of the document that you
  60.   want to index and press enter.  For the output filename type any
  61.   name you want and press enter.  The output file is not the index,
  62.   but a sorted list of all words in the document and the page
  63.   numbers that they occur on.  It is recommended that you use the
  64.   same name as the document with '.srt' as the extension.  
  65.  
  66.   The entry for page size is only used if you are using a Text or
  67.   ASCII file.  If you are using a word processor supported directly
  68.   by PC─INDEX then you can ignore this entry.  For a list of word
  69.   processors supported by PC─INDEX, look in the Document menu.
  70.  
  71.   The next entry is Start Indexing on Page.  This entry allows you
  72.   to skip a few pages at the beginning of a document before the
  73.   indexing starts.  This will let you skip a title page, table of
  74.   contents, or anything else at the beginning of a document that
  75.   you don't want to index. 
  76.  
  77.   The First Page Number to use setting will determine what page
  78.   number PC─INDEX will use as the first page number.   This entry
  79.   can be used with the Start Indexing on Page setting so that you
  80.   can start indexing on page four, but the first page number will
  81.   be page one.  
  82.  
  83.   The rest of the selections can be broken into two types.  Which
  84.   word list to use and what type of conversion to perform.  One
  85.   selection can be made from the choices in each of the two groups.
  86.  
  87.   The three choices on the left determine what words will be
  88.   included in the index.  Here are the options and the effect that
  89.   they will have on an index.
  90.  
  91.   Don't Use any Word List:  When this option is selected every word
  92.   in the document will be included in the index.  Common words like
  93.   'a', 'and', 'the', etc. will be indexed using this option.
  94.  
  95.   Use Include Word List:  When the Use Include Word list option is
  96.   selected, PC─INDEX will compare the extracted word to the include
  97.   word list.  If a match is found, the extracted word will be
  98.   included in the extracted word list and the index.
  99.  
  100.   Use Discard Word List:  When the Use Discard Word List option is
  101.   selected, PC─INDEX will compare the extracted word to the discard
  102.   word list.  If a match is found, the extracted word will be
  103.   discarded and will not be included in the extracted word list or
  104.   the index.  
  105.  
  106.   For consistency, PC─INDEX can convert all words to be the same
  107.   case as they are being extracted.  If you want to do any
  108.   conversion, you have three choices.  Convert words to UPPER CASE
  109.   will convert all words to upper case, Convert words to lower case
  110.   will convert all words to lower case, and Convert words to UPPER
  111.   & lower case will convert the first letter in the word to upper
  112.   case and the rest of the word to lower case.  If you select No
  113.   Conversion then no conversion will take place.
  114.  
  115.   The completed window should look like this:
  116.  
  117.   ┌───────────────────────────────────────────────────────────────┐
  118.   │  Input File Name:   (Name of Document to process)             │
  119.   │  pci.doc                                                      │
  120.   │                                                               │
  121.   │  Output File Name:                                            │
  122.   │  pci.srt                                                      │
  123.   │                                                               │
  124.   │  Page Size  Start Indexing on Page   First Page Number to use │
  125.   │     60               5                           1            │
  126.   │                                                               │
  127.   │  Don't Use Any Word List    X  Perform No Conversion on Word  │
  128.   │                                                               │
  129.   │  Use Include Word List         Convert Word to UPPER Case     │
  130.   │                                                               │
  131.   │X Use Discard Word List         Convert Word to lower Case     │
  132.   │                                                               │
  133.   │                                Convert Word to UPPER/lower    │
  134.   │                                                               │
  135.   └───────────────────────────────────────────────────────────────┘
  136.  
  137.   When you have finished entering the filenames and other
  138.   information, press F10 to begin processing.
  139.  
  140.                       Extract Capitalized Words
  141.   The Extract Capitalized Words selection works in exactly the same
  142.   manner as Extract Single Words, except that it only extracts
  143.   capitalized words (i.e. names).
  144.  
  145.                        Build Single Word Index
  146.  
  147.   Build Single Word Index  is the final step in creating a single
  148.   word index.  It takes the file created by the 'Extract Single
  149.   Words' selection and edited by the 'Edit Extracted Word File'
  150.   selection and creates an index.
  151.  
  152.   Select 'Build Single Word Index' from the FILE menu.  You will be
  153.   asked for the input file and output file.  Enter the name of the
  154.   extracted word file that you created with the Extract Words
  155.   process.  This file should have '.SRT' as the filename extension.
  156.  
  157.   Next you will be asked what name you want to use for the output
  158.   file.  This is the filename of the index .  It is recommended
  159.   that you use the original document name with the extension 
  160.   '.NDX'.   
  161.  
  162.   The Wildcard Description file is only used if you are processing
  163.   a group of files together.  If you indexed a group of files then
  164.   use the same wildcard description filename here.  It contains
  165.   information that PC─INDEX needs to complete the index.
  166.  
  167.   Next, PC─INDEX wants to know the page length (how many lines per
  168.   page) you want to use.  The default setting is 66 which is the
  169.   proper setting for letter size paper.  If you are using legal
  170.   size paper, the proper setting would be 88.  This number does not
  171.   need to match the lines per page setting you used when you
  172.   selected 'Extract Words'.  Most laser printers will only output
  173.   60 lines per page.  If you will be printing the index on a laser
  174.   printer, you will probably want to set this option to 60.
  175.  
  176.   The next item to fill in is the page width.  Here you will enter
  177.   the total number of characters that will fit on one line of your
  178.   printer.  The maximum width accepted by PC─INDEX is 132
  179.   characters.  The number next to page width in reverse video is
  180.   the calculated width required for the settings you have selected.
  181.   This number (required width) must be smaller than the Page Width
  182.   setting or an error will occur.
  183.  
  184.   Next, PC─INDEX asks you the number of columns you would like the
  185.   output to be in.  You will be able to produce an index up to four
  186.   columns wide.  An example of a two column index is included at
  187.   the end of this document.
  188.  
  189.   The column width is the next entry.  This entry controls the
  190.   width of each column in the index.  The minimum allowable width
  191.   is 30 characters and the maximum is 99.
  192.  
  193.   The number of spaces between columns can range from 1 to 9
  194.   characters.
  195.  
  196.   Next fill in the top, bottom, left, and right margins to the
  197.   settings that you wish.
  198.  
  199.   The completed input window should look like this:
  200.  
  201.   ┌───────────────────────────────────────────────────────────────┐
  202.   │  Input File Name:                                             │
  203.   │  pci.srt                                                      │
  204.   │                                                               │
  205.   │  Output File Name:                                            │
  206.   │  pci.ndx                                                      │
  207.   │                                                               │
  208.   │  Wildcard Description File Name: (Leave Blank if not needed)  │
  209.   │                                                               │
  210.   │                                                               │
  211.   │  Page Size   Page Width  (Columns)    Number of Columns       │
  212.   │     66           80          78              2                │
  213.   │  Column Width   Space Between Columns    Top Margin           │
  214.   │     30                   3                   5                │
  215.   │  Bottom Margin       Left Margin         Right Margin         │
  216.   │      5                  10                   5                │
  217.   └───────────────────────────────────────────────────────────────┘
  218.  
  219.   When you have finished entering the filenames and other
  220.   information, press F10 to begin processing.
  221.  
  222.   You should see a status box which tells you the number of words
  223.   to be processed, the number of words actually processed, the
  224.   letter of the alphabet currently being processed, percentage
  225.   completed, and the elapsed time.
  226.  
  227.   When this is finished, you will be returned to the main menu and
  228.   the completed index is contained in the text file under the name
  229.   you entered.  If you wish to view the file you can select View
  230.   Index from the File Menu.  If you want to print the index to a
  231.   printer select Print Index from the File Menu.  Since the index
  232.   file is an ASCII file, you could also load it into almost any
  233.   word processor and edit it further if you wish. 
  234.  
  235.  
  236.                          Word Frequency List
  237.  
  238.   The Word Frequency List selection builds a word frequency list.
  239.   This list contains all unique words found in a document in
  240.   alphabetical order and the number of times that each word was
  241.   used.  This list is built from an extracted single word file.  If
  242.   you want a complete listing of all words, be sure to extract
  243.   words using the 'Don't use any Word List' option.
  244.  
  245.   Enter the name of the extracted word file that you want to
  246.   process for the Input File Name.  If you have not already created
  247.   an extracted single word file, then you will need to do this
  248.   first.
  249.  
  250.   Enter any name you want for the output file name.  This file will
  251.   be an ASCII text file when finished.  For consistency, it is
  252.   recommended that you use the document name with the extension
  253.   '.frq'.
  254.  
  255.   The minimum word count that you are asked for will allow you to
  256.   set a minimum number of occurrences for a word to be included in
  257.   the word frequency file.  In other words, if you want only the
  258.   most frequently used words in the word frequency list, you might
  259.   enter 20 or some other large number in the Minimum Word Count
  260.   entry.  This way only words occurring 20 or more times would be
  261.   included in the word frequency list.
  262.  
  263.                         Spinoff Unique Words
  264.  
  265.   The Spinoff Unique Words selection creates a file of phrases from
  266.   an extracted single word file.  This can be helpful when creating
  267.   a customized list of phrases.
  268.  
  269.   This option will through an extracted word file and write out all
  270.   unique words to a phrase file.  By editing the '.srt' file with
  271.   the Edit Extracted word file (found under the Edit Menu) you can
  272.   mark or un─mark individual words.  Then when you spin off a list
  273.   you can spin off either the marked words or the un─marked words.
  274.  
  275.   First select Spinoff List from the File menu.  Enter the Input
  276.   File Name.  It must be an extracted single word file.  Next enter
  277.   the Output File Name.  This will be a phrase file and you should
  278.   name it with a '.dbf' extension.  Finally enter 'a' or 'i' to
  279.   spin off either active or inactive words.  Press F10 and
  280.   processing will begin.  
  281.  
  282.   You can change the default file names that PC─INDEX uses for
  283.   phrase list by using the Edit Word List Filenames under the Edit
  284.   menu.
  285.  
  286.                            Extract Phrases
  287.  
  288.   Extract Phrases will search through a document and find all
  289.   occurrences of a list of phrases.  It is the first step performed
  290.   in creating a phrase index.  It's function is to extract each
  291.   individual phrase from a document and record it.  
  292.  
  293.   Before you begin with the Extract Phrases selection, you need to
  294.   select the proper document type from the Document menu.  
  295.   Select the Extract Phrases option from the FILE menu.  You should
  296.   now see a new window asking you for an input filename, an output
  297.   filename, the page size, the first page number to start indexing
  298.   on, and the first page number to use.
  299.  
  300.   For the input filename, enter the name of the document that you
  301.   want to index and press enter.  You can press F2 here to select a
  302.   file from a list.    For the output filename type any name you
  303.   want and press enter.  
  304.  
  305.   The output file is not the index, but a sorted list of phrases in
  306.   the document and the page numbers where they were found.  It is
  307.   recommended that you use the same name as the document with 
  308.   '.srt' as the extension.  
  309.  
  310.   The entry for page size is only used if you are using a text or
  311.   ASCII file.  If you use a word processor supported directly by
  312.   PC─INDEX then you can ignore this entry.  For a list of word
  313.   processors supported by PC─INDEX, look in the Document menu.
  314.  
  315.   The next entry is Start Indexing on Page.  This entry allows you
  316.   to skip a few pages at the beginning of a document before the
  317.   indexing starts.  This will let you skip a title page, table of
  318.   contents, or anything else that you don't want to index. 
  319.  
  320.   The First Page Number to use setting will determine what page
  321.   number PC─INDEX will use as the first page number.   This entry
  322.   can be used with the Start Indexing on Page setting so that you
  323.   can start indexing on page four, but the first page number will
  324.   be page one.  This will be useful if you want to skip a few pages
  325.   at the beginning of a document. 
  326.  
  327.   The completed window should look like something like this
  328.  
  329.   ┌───────────────────────────────────────────────────────────────┐
  330.   │  Input File Name:   (Name of Document to process)             │
  331.   │  pci.doc                                                      │
  332.   │                                                               │
  333.   │  Output File Name:                                            │
  334.   │  pci.srt                                                      │
  335.   │                                                               │
  336.   │  Page Size  Start Indexing on Page   First Page Number to use │
  337.   │     66               4                         1              │
  338.   └───────────────────────────────────────────────────────────────┘
  339.                                                                    
  340.   When you have finished entering the filenames and other
  341.   information, press F10 to begin processing.
  342.  
  343.  
  344.                        Extract Personal Names
  345.  
  346.   This menu selection is new to this version of PC─INDEX.  Extract
  347.   Personal Names will go through a document finding personal names,
  348.   first and last names and writing them out to a phrase file.  This
  349.   file can then be used to create a name index or merged with
  350.   another phrase file to create a more comprehensive index that
  351.   includes names.
  352.  
  353.   This selection is not guaranteed to find all names in a document,
  354.   but it is a good starting point.  Usually this option will
  355.   extract capitalized words that are not really names rather than
  356.   omit names.
  357.  
  358.   In order to use this option correctly, it will be helpful to
  359.   understand what is happening.  PC─INDEX scans a document until it
  360.   finds at least two capitalized words in a row.  If two
  361.   capitalized words are found, then the first word is looked up in
  362.   the Personal Name File.  If the name is found then this sequence
  363.   of capitalized words is assumed to be a personal name.
  364.  
  365.   The Personal Name File contains over 12,000 first names.  You may
  366.   want to browse through the list using the Edit Personal Name File
  367.   (found in the Edit List Menu) to make sure that it contains names
  368.   you know you need.
  369.  
  370.   When you select Extract Personal Names, you will see a screen
  371.   asking you for an Input File Name, an Output File Name, the
  372.   Maximum Number of Words in a Name, and information regarding the
  373.   surname (last name).
  374.  
  375.   For the input file name enter the name of the document you want
  376.   to extract names from.  For the output file name enter any name
  377.   you want.  It is recommended that you use a file name with the
  378.   extension '.dbf'.
  379.  
  380.   The maximum number of words in a name can be any number from 2 to
  381.   6.  There must be at least 2 words in a name (a first and last
  382.   name) and no more than 6.
  383.  
  384.   The last three choices tell PC─INDEX how last names can be
  385.   recognized.  These choices were added to help PC─INDEX to find
  386.   names faster and more accurately.
  387.  
  388.   The fastest and most accurate method for extracting names is Last
  389.   Name contains ALL CAPS.  In order to use this option, all
  390.   surnames must contain all capital letters and names that are not
  391.   surnames cannot contain all caps.  If it isn't possible to use
  392.   all caps in last names then use one of the other options.  If it
  393.   doesn't matter to you whether last names are all caps or not,
  394.   then it is recommended that you use all caps.  The increase in
  395.   speed and accuracy will be significant.
  396.  
  397.   The next option, Last Name is not ALL CAPS tells PC─INDEX that no
  398.   names will contain only capital letters.  This is the second
  399.   fastest and second most accurate method for extracting names.
  400.  
  401.   The last option, Last Name may or may not be ALL CAPS should be
  402.   selected if the way capital letters used in names is not
  403.   consistent.
  404.  
  405.   The completed screen should look something like this:
  406.  
  407.  
  408.   ┌──────────────────────────────────────────────────────┐
  409.   │  Input File Name:   (Name of Document to process)    │         
  410.   │  pci.doc                                             │         
  411.   │                                                      │
  412.   │  Output File Name:                                   │         
  413.   │  pci.dbf                                             │         
  414.   │                                                      │         
  415.   │  Maximum Number of Words in a Name (2 ─ 6)           │
  416.   │                    3                                 │
  417.   │                                                      │
  418.   │     X   Last Name is ALL CAPS                        │
  419.   │                                                      │
  420.   │         Last Name is not ALL CAPS                    │
  421.   │                                                      │
  422.   │         Last Name may or may not be ALL CAPS         │  
  423.   └──────────────────────────────────────────────────────┘
  424.                        
  425.   When you have finished entering the filenames and other
  426.   information, press F10 to begin processing.
  427.  
  428.   You should see a status box which tells you the number of words
  429.   to be processed, the number of words actually processed, the
  430.   number of names found, percentage completed, and the elapsed
  431.   time.
  432.  
  433.   After this is complete you can (and probably should) browse
  434.   through and edit the names that were just extracted by selecting
  435.   Edit Extracted Name File from the Edit List Menu.  This will
  436.   allow you to correct names if necessary or to delete entries
  437.   completely.
  438.  
  439.   You may want to merge the extracted name file with a phrase file
  440.   so an index will contain both names and phrases.  Since the
  441.   extracted name file is actually a phrase file, you can use Merge
  442.   Phrase Files (found in the Merge Files Menu) to accomplish this.
  443.  
  444.  
  445.                          Build Phrase Index
  446.  
  447.   Build Phrase Index  is the final step in creating a phrase index. 
  448.   Build Phrase Index takes the file created by the 'Extract
  449.   Phrases' selection and creates a phrase index.
  450.  
  451.   Select 'Build Phrase Index' from the FILE menu.  You will be
  452.   asked for the input file and output file.  Enter the name of the
  453.   extracted word file that you created with the Extract Words
  454.   process.  This file should have '.SRT' as the filename extension.
  455.  
  456.   Next you will be asked what name you want to use for the output
  457.   file.  This is the filename for the final index.  It is
  458.   recommended that you use the original document name with the
  459.   extension  '.NDX'.   
  460.  
  461.   The Wildcard Description file is only used if you are processing
  462.   a group of files together.  If you indexed a group of files then
  463.   use the same wildcard description filename here.  It contains
  464.   information that PC─INDEX needs to complete the index.
  465.  
  466.   Next, PC─INDEX wants to know the page length (how many lines per
  467.   page) you want to use.  The default setting is 66 which is the
  468.   proper setting for letter size paper.  If you are using legal
  469.   size paper, the proper setting would be 88.  This number does not
  470.   need to match the lines per page setting you used when you
  471.   selected 'Extract Words'.  Many laser printers normally print 60
  472.   lines per page.  If you will be printing the index on a laser
  473.   printer, you will probably want to set this option to 60.
  474.  
  475.   The next item to fill in is the page width.  Here you will enter
  476.   the total number of characters that will fit on one line of your
  477.   printer.  The maximum width accepted by PC─INDEX is 132
  478.   characters.  The number next to page width in reverse video is
  479.   the calculated width required for the settings you have selected. 
  480.   This number (required width) must be smaller than the Page Width
  481.   setting or an error will occur.  
  482.  
  483.   Next, PC─INDEX asks you the number of columns you would like the
  484.   output to be in.  You will be able to produce an index up to four
  485.   columns wide if your columns are small enough.  An example of a
  486.   two column phrase index is included at the end of this document.
  487.  
  488.   The column width is the next entry.  This entry controls the
  489.   width of each column in the index.  The minimum allowable width
  490.   is equal to the longest phrase in the phrase list that you used,
  491.   and the maximum is 99.
  492.  
  493.   The number of spaces between columns can range from 1 to 9.
  494.  
  495.   Next fill in the top, bottom, left, and right margins to the
  496.   settings that you wish.
  497.  
  498.   The completed input window should look something like this:
  499.  
  500.   ┌───────────────────────────────────────────────────────────────┐
  501.   │  Input File Name:                                             │
  502.   │  pci.srt                                                      │
  503.   │                                                               │
  504.   │  Output File Name:                                            │
  505.   │  pci.ndx                                                      │
  506.   │                                                               │
  507.   │  Wildcard Description File Name: (Leave Blank if not needed)  │
  508.   │                                                               │
  509.   │                                                               │
  510.   │  Page Size   Page Width  (Columns)      Number of Columns     │
  511.   │      66          80         78                 2              │
  512.   │  Column Width   Space Between Columns      Top Margin         │
  513.   │      30                  3                     5              │
  514.   │  Bottom Margin       Left Margin           Right Margin       │
  515.   │       5                 10                     5              │
  516.   └───────────────────────────────────────────────────────────────┘
  517.  
  518.   When you have finished entering the filenames and other
  519.   information, press F10 to begin processing .
  520.  
  521.   You should see a status box which tells you the number of words
  522.   to be processed, the number of words actually processed, the
  523.   letter of the alphabet currently being processed, percentage
  524.   completed, and the elapsed time.
  525.  
  526.   When this is finished, you will be returned to the main menu and
  527.   the completed index is contained in the text file that you named. 
  528.   If you wish to view the file you can select View Index from the
  529.   File Menu and enter the name of the index that you just created.
  530.   .  If you want to print the index, select Print Index from the
  531.   File Menu.  Since the index  is an ASCII file, you could also
  532.   load it into most word processors and edit it further if you
  533.   wish.  
  534.  
  535.                         View Index on Screen
  536.  
  537.   View Index on Screen lets you see how the index you created
  538.   looks.  You will probably want to browse the index before you
  539.   print it.  You can use this selection to view any ASCII file.
  540.  
  541.  
  542.                        Print Index to Printer
  543.  
  544.   Print Index to Printer lets you print an index on your printer. 
  545.   If you have a problem using this make sure that you have selected
  546.   the correct printer port.  
  547.  
  548.   You can change this using the Edit Default Settings List in the
  549.   Edit List Menu.
  550.  
  551.                             Save Defaults
  552.  
  553.   Save Defaults saves the current settings in the DOCUMENT menu. 
  554.   It will also save all numeric settings and default word list
  555.   filenames in the various dialogue boxes.
  556.  
  557.  
  558.                               Go to DOS
  559.  
  560.   Go to DOS allows you to perform DOS commands.  Type EXIT to
  561.   return to PC─INDEX when you are finished.
  562.  
  563.  
  564.  
  565.  
  566.